Clustering and variable selection in the presence of mixed variable types and missing data
نویسندگان
چکیده
منابع مشابه
the clustering and classification data mining techniques in insurance fraud detection:the case of iranian car insurance
با توجه به گسترش روز افزون تقلب در حوزه بیمه به خصوص در بخش بیمه اتومبیل و تبعات منفی آن برای شرکت های بیمه، به کارگیری روش های مناسب و کارآمد به منظور شناسایی و کشف تقلب در این حوزه امری ضروری است. درک الگوی موجود در داده های مربوط به مطالبات گزارش شده گذشته می تواند در کشف واقعی یا غیرواقعی بودن ادعای خسارت، مفید باشد. یکی از متداول ترین و پرکاربردترین راه های کشف الگوی داده ها استفاده از ر...
Variable selection in the presence of missing data: resampling and imputation.
In the presence of missing data, variable selection methods need to be tailored to missing data mechanisms and statistical approaches used for handling missing data. We focus on the mechanism of missing at random and variable selection methods that can be combined with imputation. We investigate a general resampling approach (BI-SS) that combines bootstrap imputation and stability selection, th...
متن کاملthe relationship between efl learners linguistic and logical intelligence and the frequency and types of informal fallacies and evidence in argumentative writing
مطالعه حاضر با هدف بررسی وجود رابطه ی ممکن میان هوشهای زبانی و منطقی زبان آموزان انگلیسی و تعداد و انواع مغلطه های زبانی و شواهد در متنهای استدلالی آنان انجام پذیرفته است.بدین منظور، 70 زبان آموز با سطح زبانی متوسط به بالا از دو موسسه زبان انگلیسی در ایران انتخاب شده و پرسشنامه های مزبوطه را تکمیل نموده و متنی استدلالی نوشتند. متون نوشته شده مورد بررسی قرار گرفته و نمرات پرسشنامه ها محاسبه شده ...
15 صفحه اولexistence and approximate $l^{p}$ and continuous solution of nonlinear integral equations of the hammerstein and volterra types
بسیاری از پدیده ها در جهان ما اساساً غیرخطی هستند، و توسط معادلات غیرخطی بیان شده اند. از آنجا که ظهور کامپیوترهای رقمی با عملکرد بالا، حل مسایل خطی را آسان تر می کند. با این حال، به طور کلی به دست آوردن جوابهای دقیق از مسایل غیرخطی دشوار است. روش عددی، به طور کلی محاسبه پیچیده مسایل غیرخطی را اداره می کند. با این حال، دادن نقاط به یک منحنی و به دست آوردن منحنی کامل که اغلب پرهزینه و ...
15 صفحه اولClustering Mixed Data via Latent Variable Models
A model based clustering procedure for data of mixed type, termed clustMD, is developed using a latent variable model. It is proposed that a latent variable, following a mixture of Gaussian distributions, generates the observed data of mixed type. The observed data may be any combination of continuous, binary, ordinal or nominal variables. The model employs a parsimonious covariance structure f...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Statistics in Medicine
سال: 2018
ISSN: 0277-6715
DOI: 10.1002/sim.7697